查看原文
其他

文科出身的考古学生如何入门科技分析方法 | 考古GIS学习思路

沈劼 六把铲 2023-06-25

Much, if not all, of the data that archaeologists recover is spatial in nature, or has an important spatial component.

- Wheatly and Gillings, 2002

好久不见的“文科生入门”系列,这次的内容不完全是老师上课的大纲,而是我综合了两门相关课程的内容,整理了学习考古GIS的基本思路和一些考古学研究中的常见应用。沿用了“文科出身的考古学生如何入门科技分析方法”这个系列标题,是希望鼓励大家不要畏难,多尝试学习新的方法和技术,扩展自己的研究工具箱。所谓文科和理科只是高考时的粗暴分类,不要被刻板印象限制了自己的学习能力。特别是在考古这样的跨学科领域里,大胆跨出舒适圈去接触不同的知识体系和新的方法是很重要的。

之前我更新过一些空间分析的基本概念,但是写了两篇之后我就停了。一方面是因为忙,另一方面是因为我在想,如果我做的仅仅是把课程内容翻译整理,那何不直接把这件事交给翻译器。而且这些内容在教材或者网上的免费视频教程里也都能找到,没必要制造知识冗余。

对于一个想要入门的考古学生来说,最重要的也许不是一本面面俱到的教科书,而是学习的思路,是理解考古和GIS的结合点。所以我等学期结束后,重新梳理了一遍我学的内容,整理成了这篇推送。

全文内容分三个部分,第一部分是研究思路,也就是如何理解考古材料的空间属性,以及能由此提出哪些研究问题,顺带一些是GIS在考古学中常见的应用方法,第二部分是基础概念介绍,主要是一些常见的术语和基础知识的解释,由于本文太长我放到下一篇了。

对于考古GIS还不太了解的朋友,我建议先看第一部分就行,看到不明白的概念再参考第二部分(我尽量做到简单明了)。先弄明白为什么要学GIS,学了能用来干什么,再决定需不需要真正投入精力学习。但无论如何,了解这一方法的应用都是必要的,即使自己不会实践,也可以考虑能对自己的研究有什么样的帮助,以及是否能找人合作完成

当然,由于都是我自己整理的内容,而且我也只是上过两门课,并没有特别多的实践经验,且文中内容大都是英文翻译过来,所以可能会出现翻译错漏,理解不到位的情况,更不可能全面覆盖考古GIS的所有应用领域。希望大家能多多指正,也帮助我学习成长。

参考文献:

Bolstad, Paul. GIS Fundamentals: A First Text on Geographic Information Systems. Sixth edition. Ann Arbor, MI: XanEdu Publishing Inc, 2019. 
Wheatley, David. Spatial Technology and Archaeology: The Archaeological Applications of GIS. London ; New York: Taylor & Francis, 2002.
两本书在Libgen都有,前者是GIS教材,内容包含全面。后者是考古GIS教材,内容更偏重考古方向的应用以及对研究问题的思考。建议从后者开始看起,把前者当作查询的工具书。
部分已经在之前推送说过的内容这里不再详述
GIS笔记 | 基础空间分析 Basic Spatial Analysis (上)
GIS笔记 | 基础空间分析 Basic Spatial Analysis (下)

一、考古材料的空间属性

考古材料大到遗址群,小到一件遗物,都有绝对位置和相对位置。绝对位置是它们的坐标,是在现实空间中的位置,是研究的基础。而我们研究中更关注的,是相对位置,是分布规律、人地关系、空间分布对人类活动的影响等。所以在开始分析前,甚至在数据搜集之前,就要想好自己的研究问题是什么,解决这个问题需要什么样的数据,这些数据是否能通过调查、发掘、文本材料、线上数据库等方式获取。

其次,空间范围也是要思考的问题。以遗址为例,遗址的范围如何界定?是发掘面积,勘探面积,遗迹所覆盖位置,还是遗址使用者曾经活动的范围?如果是后者,那“遗址”的范围可能远超居址所在的区域,周边遗物较少的狩猎或农业活动区域也会被囊括进来。

此外,空间信息的呈现方式也很重要。我们在呈现遗址或遗迹分布的时候,时常用一个点、一条线、一个方形或圆形来代表。但地图上的要素是对现实中的遗址或遗迹的高度概括,真实的聚落、房屋形态千变万化,道路也并不是单纯的一条线,而是存在宽度和高度上的变化。这些在地图显示时被忽略的特征,是否会影响我们的空间分析和呈现效果,也是要提前想好的。

最后就是研究对象的属性。除了它们的空间位置之外,其他属性数据也是空间分布的一部分,比如要研究遗址在某流域分布随时间变化的情况,每个遗址点的年代属性就是必要的。要研究聚落内不同等级房屋分布与公共建筑的位置关系,那每一个房屋的等级属性,或是屋内不同种类遗物类型的属性也是必要的。这些属性数据可以在搜集空间位置信息的时候就一起记录,也可以分别记录后在分析时合并。但是最重要的还是,做之前就想清楚自己需要什么。

最最后要记住的一点,就是所有的空间分析和数据分析,都是基于模型计算的。而模型并不是现实,只能反映符合模型条件下的现实。而且数据是可以操纵的,在搜集数据和选择数据的时候会有误差,在统计和将结果可视化的时候也会因需求不同保留和忽视某些数据。所以空间分析和统计所得的结果永远不是完全正确和客观的,误差和主观选择会出现在每一步里,而我们作为研究者,要能够意识到它们的存在,知道它们会对我们的结果造成哪些影响,并且如实地记录在自己的结论里。


二、如何获取GIS数据

搜集数据往往是考古研究的第一步,和其他学科不同的是,我们的数据通常只能靠自己做田野来获得,网上公开的数据库多是现代数据,对我们帮助不大。

获取数据的方式大概有以下几种:

1.田野调查或发掘时用GPS,全站仪等设备打点;

课上老师还提到了一个简便版,就是每个学生下载一个app并连到共用的ArcGIS Online数据库,然后就可以利用手机GPS来采点,还可以提前根据提前设置的内容来填写所采的点的类型并且上传所拍照片。我们的作业就是每人找出十个校园内的标志建筑物然后采点拍照。

2.利用卫星遥感生成的栅格数据;比较有名的公开卫星图数据库就是上世纪六十年代科罗娜卫星所拍摄的全球卫星图。由于上世纪六十年代我国城市化面积还没那么大,卫星图上能够比较清楚地看到地貌和遗址等,所以是对考古比较有用的一个数据库(https://earthexplorer.usgs.gov/)。

3.手动在地图软件(Google earth等)中搜索坐标,集中在表格里后导入GIS软件;

(图源:自己的数据)

4.历史地图,将地图高清扫描后,利用控制点进行地理配准(对地图进行坐标和投影的校正,以使得地图坐标点准确,使得地图拼接准确)。下图就是把非洲地图配准后匹配到现代坐标系统里的结果,可以看到由于CRS变化导致的形变。

(图源:https://earthworks.stanford.edu/catalog/stanford-qy755sg2430

5.在网上下载已公开的地形和水文等信息,或者利用已发表且公开的数据库;

6.用Web APIs和OpenRefine来进行地理编码。API的具体原理我不太清楚,但具体应用就是如下图所示。创造一个有公司名、公司街道地址、城市和州等信息的表格,通过美国街道地址地理编码服务,然后自动检索并生成每个公司的经纬度坐标。
(图源:课程作业)
同理也可以换成在地图上有记录的遗址名、文保单位、博物馆等,当数据量很大的时候可以节省手动搜索和输入的时间。国内应该有类似的应用,但我没有试过。

目前我学到的就是这几种,如果有别的欢迎补充。大家在使用数据的时候(特别是二手数据),一定要注意记录数据来源、CRS、栅格的分辨率(resolution)等元数据(metadata),不能(像最开始的我一样)随便下一个图层文件就往自己的数据上用。这几个东西的重要性我在基础概念那一篇里会说。


三、GIS数据的本质

不管是向量数据还是栅格数据,本质上都是由一条条的记录组成的。一条记录可能是一个点,一条线,一个多边形,或者是一个栅格中的像素。不管组成数据的最基础的记录单元是什么,它都会拥有:

1)几何形状:点线面/像素

2)关键字段(Key field):一条记录的“唯一标识符”,也就是“唯一ID/UID”。这个字段的值必须是唯一的,以便于对数据进行标识和管理。像是器物编号之类的属性就是它的关键字段。

3)空间坐标(Coordinates)

4)属性(Attribute):平面空间坐标以外的全部信息,如高程、年代、类型等。

在进行空间分析的时候,不同的数据类型,能够用到的分析方法和所提的研究问题也不一样。下面我分别说明一下对空间信息和非空间属性的分析在考古学中的应用。


四、对非空间属性的分析

其实这一类分析和我们常用的统计没有区别,都是对于定量或定性数据的处理。

1.数据统计和计算

最简单的就是对所有记录的数据进行统计分析,如下图所示,统计总数、某个属性的平均值、最大/小值等。

(图源:https://github.com/mapninja/Earthsys144/blob/2b45f235da214400464f79a22874a63e6ee7df53/Labs/Week_08/Being_John_Snow.md

此外还可以进行计算,比如一个中国省市行政区划的向量数据,每个省的记录里都有人口和面积,就可以计算人口密度等。

其他的详见之前的推送。

2.合并和增删

如果有多个相关的数据表,就可以进行合并,并且按照需求进行增减。比如对同一地区进行了两次调查,调查的范围有一定重叠,就可以选择将两次的数据合并,重叠的记录则以最新一次的结果为准。

不仅是属性表,图层也可以合并。比如在地形图上合并一个行政区划的边界线,或是将不同地区的高程图合并为一张。下图就很好地展示了,城市范围、道路交通、植被覆盖和地形图是怎么合并到一起最后形成一张总图的。

(图源:https://www.esri.com/arcgis-blog/products/product/analytics/how-to-perform-spatial-analysis/

3.筛选

根据研究问题来设置筛选条件,利用集合代数“小于<”,“大于>”,“等于“=”,和“不等于<>”等条件进行查询;或是用布尔代数“或”,“与”,“非”等条件来进行查询。具体的之前推送说过了,不再详述。

4.关联

关联是利用关键字段把不同的表格关联起来,这样可以互相调用另一个表格的信息,更新也会同步到关联的表格。为什么要选择关联而不是直接合并表格呢?因为不同数据的基本空间单元可能不一样。比如研究中有两个数据库,一个是遗址信息数据,包含遗址名和坐标;另一个是遗物信息数据,包含遗物编号,遗址名,遗物类型和年代。
在呈现遗址分布的时候,只需要用到遗址信息数据,但是如果要呈现遗物类型在每个遗址的百分比,就需要调用遗物信息的数据。而两个表格如果合并,要么向下合并以遗物为基本单元,这样每个坐标上都会有一堆重重叠叠的遗物点;要么向上合并以遗址为单元,但是这样就失去了遗址内不同年代或类型的遗物的信息。因此,最好的方式是用遗址名这个关键字段将两个表格进行关联,然后再互相调用信息。


五、对空间信息的分析应用

1.设计田野调查方案

在设计调查方案的时候,可以预先用GIS规划好调查的区域,然后根据需求进行采样,再按图索骥到选定的区域进行调查。下图是我们的课程作业,采样方法可以选择右上的系统抽样,左下的随机抽样,或者右下的根据地形分层抽样。

除了点状采样,还可以自己创建一个栅格代表调查区域或探方,然后在栅格中抽样进行调查或者试掘。下图是我另一个作业,长条状的栅格是为了方便调查时可以走直线,不用在方形区域里绕圈浪费时间;然后根据背景不同颜色所代表的土质进行了分层随机抽样。


2.缓冲区分析(Buffering)和叠置分析(Overlay)

缓冲区(buffer)是指距离一个或多个要素小于或等于指定距离的区域。可以用栅格(raster)或矢量(vector,点、线或面要素)数据来确定缓冲区。缓冲(buffering)是创建缓冲区的过程。缓冲区分析通常用于比较某些给定阈值距离的“外部”区域(下图浅灰色区域)与某些阈值距离的“内部”区域(下图深灰色区域)。

缓冲区可以用来计算遗址周边步行一日可达的距离,从而用来判断人的活动范围;或是用来计算狩猎或屠宰场所到居址的距离,铜矿、水源和木柴资源点到青铜冶铸地点的距离等等。

叠置即是合并来自两个或多个数据层(layer)的空间和属性数据,从而生成新的空间关系和属性联系。叠置的前提条件之一就是叠置的数据层必须使用共同的坐标系统,否则就会产生空间上的错位。

比如我们现有两份空间数据,一个是遗址的地形图和探方的分布,内含空间坐标、探方负责人等信息,另一个则是遗迹遗物的分布,内含空间坐标、所在探方的编号、地层等信息。如果两份数据所用的坐标系统一致,就可以叠置起来,并通过探方编号来将遗迹遗物与探方一一对应,从而生成遗址内遗迹遗物的分布;或是与地层编号对应,从而看到遗迹遗物高程上的差异等。

详细解释见我之前的推送。

下图是我们作业,将湖泊分布和道路分布叠置后,选择“同时处于湖泊及道路一定距离”的合适露营地点。这就是分别计算缓冲区后,将二者缓冲区叠置所得的结果。

还有一个比较相关的是利用多条件叠置分析预测遗址位置,如下图所示,我们将左上的水体分布和右上的道路图叠置,然后重新生成了一个栅格图层,栅格的值是根据两个距水体和道路距离计算出的“宜居值”,然后在将不同结果用不同颜色表示,最后得到该地区宜居程度的可视化结果。类似的分析可以应用于用水源和可用耕地预测居址,用矿产和燃料分布预测冶金工坊等研究。


3. 利用高程数据生成立体地形图(Hillshade)和坡度图(Slope)

Hillshade技术可以用来创建山地阴影图,使地形在图像上呈现出自然的立体感,从而更好地展示地形地貌和地形特征。

如下图所示,左侧是利用不同模型生成的高程图,右侧是经过处理后更加立体直观的地形图。

而基于高程计算的坡度可以很好地展示地形的陡峭程度,也是之后做路径分析的基础。下图是基于上面的地形图生成的坡度及等高线地形图。

(图源:我的作业;希望没人吐槽我颜色选得难看)


4. 视域分析(Viewshed)

视域分析用于确定在某个区域内,从某个人的视角出发,哪些地方可以被观察到或看到某个目标。它通常基于数字高程模型(DEM)数据,在设置好观察者的身高、最大可见距离等参数后,通过计算来确定可视区域,并生成相应的视域分析结果图。

视域分析在考古中应用非常普遍,比如分析高等级的房屋处是否更容易看到举行仪式的场所;一个聚落的视域范围是否和它的防御设施建设有关等。

下图是老师的例图,背景是山脉地形,站在绿色的点上,视野不被遮挡能够看到的区域就是红色区域。


5. 最优路径分析(Least cost path

用于确定从一个起点到终点的最短路径,但是不是基于地理距离,而是考虑了路径上通过的各个地形、地貌、环境等要素的耗费值。在进行最小耗费路径分析时,需要先确定这些要素的耗费值,例如通过不同类型的土地使用、高程、坡度等会带来不同的耗费值,然后根据起点和终点之间的空间关系,利用一定的算法进行路径分析,以找到最小耗费路径。

一般来说先利用高程图来计算耗费表面(cost surface, 或者叫代价表面/成本表面),也就是基于坡度来计算通过一个栅格像素单元的耗费值(成本值),然后综合所有像素的耗费形成耗费表面这个图层。然后设定好起点和终点,计算两点间耗费最短的路径。

下图是我们计算的从不同红色点遗址到绿色点中心遗址的最优路径,可以看到为了避开一些坡度较大的位置,路径根据地形进行了迂回。

而这张图中加入了一道城墙(图中黄线)作为障碍,红线和蓝线分别是无墙和有墙时所走的最优路径。


6. 中心点(Mean center)和标准距离(standard distance)

可以根据不同要素间的距离来计算其空间上的中心点。比如上图中的红色和绿色点,都是计算所得的遗址中心点。空间上的中心有时候并不代表文化、政治或经济意义上的中心,所以如果发现了中心点的偏差,就可以继续分析是什么因素让政治或文化中心偏离了空间中心。

而标准距离是指一个点集合内所有点到该点集合的平均距离。比如一个聚落内所有房屋到公共广场的距离,或者到水源的距离,由此可以判断房屋分布的规律,或者不同等级房屋获取公共资源的便利程度。


7.邻近度分析
Thiessen多边形(Thiessen polygon),也称为Voronoil多边形或Dirichlet多边形,是一种常用的空间分析工具,它是根据一组点之间的距离关系生成的多边形区域,每个多边形内任意一个点到中心点的距离都短于到其他中心点的距离。比如在一个地区内有数个中心聚落,还有一些小型聚落,以中心聚落来划分范围后,就可以值知道小型聚落到哪个中心聚落距离最近,受哪个中心聚落的势力影响。此外还可以根据中心点的资源,比如水源、交通、政治或宗教重要性等给与不同的权重,从而让某些权重更大的中心点覆盖更大面积。

下图是上课的一篇reading里的例子,根据空间距离来划分的主要城镇所覆盖的范围(黑线多边形)和实际的行政区划(灰线边界)并不完全一致。因此作者接着讨论了哪些历史或政治因素影响了行政区划的设置。

(图源:Lewis, Barry, 和Channabasappa S. Patil. 《Chitradurga: Spatial Patterns of a Nayaka Period Successor State in South India》. Asian Perspectives 42, 期 2 (2003年): 267–86. https://doi.org/10.1353/asi.2003.0046.)


8.历时性分布的变化

可以比较不同时间地形、水文、遗址遗迹分布的变化,并且筛选出变化的要素或者栅格进行进一步分析产生变化的原因。这一方法对于研究历时较长的大型遗址及其周边地貌应该比较有用。

下图深绿色区域是某次水文调查产生的栅格数据,浅绿色是最新的水文栅格数据。

在将两个数据计算汇总后新生成了历时性变化的图层,截取左上角的交汇区域可以看到,黄色区域是新出现的水体,而绿色是消失的水体,米黄色的大面积区域则是土壤或是没有变化的水体。从新的图层就可以很好地追踪变化过程,并进行针对性的分析。


9.动物遗存的量化统计

这是之前看文献的时候看到的一个很有意思的GIS应用,“以ArcGIS 软件包中的空间分析工具为技术依托,重点对遗址出土的大型动物的骨骼单元分布模式进行了更为准确的统计与分析”。最后所得的就是骨骼单元分布的热力图。这个应用提醒了我“空间”这个概念是可以很广泛的,不同尺度的空间分析贯穿了考古学研究的方方面面。
(图源:张乐, 张双权和高星. 《地理信息系统在动物考古学研究中的应用:以贵州马鞍山遗址出土的动物遗存为例(英文)》. 人类学学报 38, 期 3 (2019年): 407–18. https://doi.org/10.16359/j.cnki.cn11-1963/q.2019.0038.)


写到最后

写了这么多,画了这么多大饼,能够看到这里的人肯定在想,这堆分析具体到底要怎么做。我本来打算写个系列讲一下常见几个应用的操作方法的,但是由于工程量太大,而且没必要做翻译器就能做的工作,所以我只分享一下我上GIS基础课程老师的作业,基本覆盖到了我文中提到的所有应用,还附有非常详细的手把手教学。虽然主要使用QGIS而不是ArcGIS,但是理解了分析方法后软件间的操作差异很容易解决,有需求的人可以自己去查看:

https://github.com/mapninja/Earthsys144/tree/2b45f235da214400464f79a22874a63e6ee7df53

另一个考古GIS课程的作业,由于数据和教程老师都没有公开,所以就不放了。大家根据自己的数据和研究问题摸索吧。
推荐一下ChatGPT,我觉得chatGPT真正的好用之处在于个性化的技术支持。在学习新的软件,比如ArcGIS和FileMaker的时候,通常会遇到很多问题,如果都去找人问会很麻烦别人。但只靠搜索引擎的话,又很难把自己的问题表述清楚并且找到和自己问题相似的案例。

但用ChatGPT就完全不用担心这事,口语化地把自己问题说一遍,要是答案不太贴切就再补充些信息,基本就可以解决初学者能遇到的所有常见或者略有刁钻的问题了。

GIS系列应该不会再更了,因为小沈已经学到了自己需要的程度,要去学新的技能了。
祝大家学习愉快吧!


有兴趣可以看一下我当初写的关于“科技方法”的理解,也适用于GIS的入门学习:
我个人一直认为科技考古不该成为一个单独的分支学科,这样的命名人为地割裂了考古学者和科技方法的联系。所有的考古学者都应该了解并能够应用与自己研究相关的科技手段,正如所有参与考古学研究的科学家都应该理解自己通过科技手段所得的检测结果具有什么样的考古学含义。
然而科技手段的原理并不是那么容易理解的,很多考古学者在应用科技手段的时候都处于知其然而不知其所以然的境况,只知道有某种手段可以用,但从提供样本到输出结果之间的环节,则完全不理解如何运作。我们投入自己的样本,然后收获一堆数据,这就是所谓的科技黑箱(Science Black Box)或者黑匣子。对其运作机制的不了解,使得所谓的科技考古成为了某种新的科学迷信。另一方面,一部分人过高地估计了它的难度从而产生抗拒,一部分人则因为运作机制的不透明而对之抱持怀疑的态度。
想要打破黑箱,仿佛就只有从高中物理化学开始从头学起这一条路。但事实上,我们不可能,也没必要花费大量的精力以求达到自然科学学者的水平。要懂科技原理,但是又不必太过深入,如何获得这样够用即可的平衡,就是我在这节课上一直在思考的事情。
对科技手段在考古中的应用,我感受到的有三个阶段:
第一是入门,了解有从考古材料中会延伸出哪些问题,对应可以解决这些问题的有哪些方法。这一阶段还处于照本宣科的时期,不必太了解背后的科学原理,只要知道用什么,怎么用,怎么释读分析结果就可以了
第二是部分打破黑匣子,了解技术手段背后的原理,知道不同方法的差异,各自的优势和局限所在,进而深度解读分析结果,并根据自己的材料和问题,调整所用的方法。
第三则是参与方法设计与创新,使之更适应考古学的需求,专为解读考古学材料而服务。
我在这门课上学到的内容,大概就在阶段一以上,接近阶段二的程度,但是这篇推送并不会太深入地讲各种科技方法的原理,而是落脚于以操作链的思路来寻找研究问题和分析手段的对接点,借助这一理论的思维模式来完成对科技方法的快速入门。但是对于有志于利用科技手段来完成自己研究的考古学者,我认为阶段二是一个应当追求的目标。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存